max rank | avg. rank | sentence |
---|---|---|
196 | 81.6000 | Il Ticino ha fatto come sempre la sua (importante) parte. |
202 | 97.5833 | Anche da noi era così fino a due tre o anni fa. |
203 | 91.0000 | Questo è importante in particolare per i bambini. |
205 | 82.3333 | Questo è però possibile solo una volta nella vita. |
218 | 74.1000 | Per noi, è tutto il mondo con la sua protezione. |
229 | 92.7000 | Per noi la sicurezza nella guida viene prima di tutto. |
305 | 173.8000 | Al via in questi due giorni nuove misure in Ticino. |
307 | 136.7500 | Ma quali possibilità vi sono in questi casi? |
312 | 155.8571 | Una futuro professionale per tutti i giovani! |
312 | 153.4286 | Un futuro professionale per tutto i giovani! |
323 | 96.7143 | Questo è alla base del nostro programma. |
328 | 139.7778 | Il nostro settore professionale ha bisogno di più donne. |
340 | 122.5000 | «Per noi questo periodo di studio è stato molto importante. |
342 | 99.1429 | È questo il nostro più grande successo. |
342 | 125.6250 | Il vostro successo è anche il nostro successo. |
358 | 145.7333 | Inoltre al centro di tutte le nostre attività abbiamo sempre posto le esigenze dei clienti. |
359 | 162.0000 | Ci sono attività per giovani e meno giovani. |
366 | 107.2500 | E, per alcune persone, questo è molto importante. |
378 | 111.3636 | Ci sono molti di loro per la maggior parte del tempo. |
383 | 97.7333 | Il primo giorno di lavoro è importante per tutto il periodo del rapporto di lavoro. |
396 | 154.5000 | Grazie per tutto quello che sei il migliore. |
401 | 144.1111 | Ma questa non era la soluzione ai suoi problemi. |
421 | 148.5556 | Si tratta di informazioni importanti a disposizione di tutti. |
422 | 211.5000 | I risultati saranno disponibili nel corso del 2019. |
433 | 123.9000 | La protezione dei dati personali è molto importante per noi. |
439 | 145.6364 | La persona è sempre al centro delle nostre attività di cura. |
440 | 105.6364 | Se uno non può o non vuole non è un problema. |
471 | 195.0000 | Ma soprattutto che senso dare alla nostra vita. |
471 | 144.8889 | In questo senso c’è ancora molto lavoro da fare. |
474 | 205.1250 | E chi potrebbe (o dovrebbe) dare di più? |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II